查看原文
其他

癌症基因组突变特征分析|医学DNA专题

运营部-LZB 联川生物 2024-03-27


体细胞突变


绝大部分癌症都是由体细胞突变(somatic mutation)引起的。在从受精卵到癌细胞的有丝分裂的过程中,体细胞基因组不断积累着内源性和外源性突变(图 1),这些突变通常是由DNA的错误复制、诱变、酶促修饰以及损伤修复缺陷等因素造成的。在过去的研究中,某些癌症类型的大量体细胞突变被证实来源于外部因素的诱变(由吸烟和紫外线分别导致的肺癌和皮肤癌)或DNA的损伤(部分结直肠癌中的DNA错配修复缺陷)。然而,目前我们对大多数癌症类别中造成体细胞突变的生物学过程的认知仍然十分有限。因此,揭示癌症发展背后的突变过程多样性,对癌症的病因解析、预防和治疗具有重要的潜在意义。



图 1. 从受精卵到癌细胞的突变积累过程(Stratton et al., 2009)


癌症基因组测序


对癌症基因组进行高通量测序可以全面表征人类肿瘤中的体细胞突变状况,其范围覆盖了从单碱基突变到染色体或全基因组规模上的变异(图 2)。全基因组测序(WGS)和全外显子组测序(WES)是识别基因组突变最常用的测序方法。近些年来,随着得到测序的肿瘤基因组数量的不断增加,研究人员扩展了包括原发性和转移性肿瘤在内的多种癌症类型的 "驱动"突变(driver mutation)全景图,描述了广泛的复杂结构变异,揭示了影响肿瘤进化和异质性的突变模式,研究了非编码突变在癌症中的作用,并初步阐明了肿瘤免疫逃避和抗癌治疗耐药性的分子机制(Cortés-Ciriano et al., 2022)。



图 2. 癌症基因组分析的工作流程(Cortés-Ciriano et al., 2022)


突变特征


体细胞突变是由特定的突变过程(mutational process)引起的,例如DNA的修复缺陷、错误复制和诱变等。这些过程会诱导特定的核苷酸变化,例如,吸烟者的肺癌以大量的G>T碱基颠换为特征,而黑色素瘤则以二嘧啶位点的C>T碱基转换为特征。由不同突变过程诱导产生的不同变异类型组合被称为突变特征(Mutational Signature)。

癌症基因组中总的体细胞突变来源于多个突变过程的不断累积,因此,单个癌症基因组中包含了多个叠加的突变特征。如图 3 所示,不同的突变过程在癌症发生的不同时期具有不同的作用强度。在起始阶段,体细胞中的所有突变都是由较弱的内源性突变过程所致,随时间推移,其他突变过程的激活导致细胞谱系和癌症基因组的突变频谱不断改变,从而使得最终被测序的癌症基因组并不类似于任何一个有效的突变过程特征。



图 3. 单个癌症基因组中的各类有效突变过程特征(Alexandrov and Stratton, 2014)

通过归纳总结过往的泛癌基因组分析结果,依据不同的变异类别可将突变特征划分为以下四种类型:单碱基替换(Single Base Substitution,SBS)、双碱基替换(Doublet Base Substitution,DBS)、小片段插入缺失(small Insertions and Deletion, ID)和拷贝数变异(Copy Number Variation)。以单碱基替换(SBS)为例(图 4;图 5)。如果以嘧啶的变异为判断标准,则实际存在六种不同的替换类型(SBS-6: C>A, C>G, C>T, T>A, T>C 和 T>G)。在考虑变异位点相邻的5'和3'端碱基背景后,单碱基替换的种类可以进一步扩大至96种(SBS-96)。


图 4. 突变特征类型(Cortés-Ciriano et al., 2022)


图 5. 单碱基替换、双碱基替换和小片段插入缺失类型的突变特征示意图(Bergstrom et al., 2019)


癌症病因与突变特征


不同的癌症病因会导致不同的突变过程,由于其各自独特的突变模式和在基因组上的特定活动,反映不同突变过程的突变特征间往往存在着显著差异。如图6所示,在几乎所有类型的癌症中都能观察到一个与老化有关的 Signature 1。Signature 24 和 Signature 22 分别代表与黄曲霉毒素和马兜铃酸(部分中草药产品中含有)相关的特征,Signature 4 反映了由吸烟诱导产生的突变过程特征,Signature 3 和 Signature 6 都来源于内在的DNA修复机制,分别代表了DNA双链断裂修复缺陷和DNA错配修复缺陷。然而,与大量突变特征相关联的生物学过程仍然未知。因此,通过识别由人类癌症全基因组或全外显子测序数据分析得到的体细胞突变特征,为解析人类癌症发展的突变过程提供了一个系统的视角,使我们可以在多个内部(衰老和内在DNA修复)和外部(环境暴露)致癌因素中推测出个体癌症发展的关键病因。



图 6. COSMIC数据库中的突变特征及其相关病因(Nakagawa et al., 2018)


突变特征的提取


通过对大量癌症基因组的联合分析可以从头(de novo)揭示与不同突变过程相关的突变特征。例如,在全基因组泛癌分析(Pan-Cancer Analysis of Whole Genomes,PCAWG)项目中,研究人员以2780个肿瘤配对样本的全基因组测序数据为基础,应用非负矩阵分解(Negative Matrix Factorization,NMF)的方法建立了癌症体细胞突变目录(Catalogue Of Somatic Mutations In Cancer,COSMIC)突变特征数据库。这种分解类似于在听得足够长且有足够变化的基础上,将管弦乐的声音分离成由不同乐器构成的特定成分。与之相比,利用少量基因组识别突变过程的能力是不足的。因此,对一小部分样本的突变特征分析通常是使用非负最小二乘法(Non-negative Least Squares,NNLS)等方法重新匹配(Refitting)现有突变特征的相对贡献(图 7)。



图 7. 突变特征分解(Cortés-Ciriano et al., 2022)

随着癌症基因组测序规模的不断增长,研究人员将会更准确的识别越来越多的突变特征。对突变特征的详细分析可以确定造成DNA损伤的因素,以及在癌症中起作用或出现问题的DNA修复和复制途径,从而在揭示癌症的病因及抗癌疗法的新目标中发挥重要贡献。







参考文献:




[1] Alexandrov LB, Stratton MR. 2014. Mutational signatures: the patterns of somatic mutations hidden in cancer genomes. Current Opinion in Genetics & Development 24, 52–60.

[2] Bergstrom EN, Huang MN, Mahto U, Barnes M, Stratton MR, Rozen SG, Alexandrov LB. 2019. SigProfilerMatrixGenerator: a tool for visualizing and exploring patterns of small mutational events. BMC Genomics 20, 685.

[3] Cortés-Ciriano et al., 2022. Computational analysis of cancer genome sequencing data. Nature reviews genetics 23, 298-314.

[4] Nakagawa H, Fujita M. 2018. Whole genome sequencing analysis for cancer genomics and precision medicine. Cancer Science 109, 513–522.

[5] Stratton MR, Campbell PJ, Futreal PA. 2009. The cancer genome. Nature 458, 719–724.







相关阅读




今天我就驾着七彩祥云来拯救你的全外显子(WES)数据!
NAT COMMUN:全外显子组测序发现斑秃存在KRT82基因的罕见变异|医学DNA专题
最大规模的基因组关联分析为认知克隆性造血提供新见解|医学DNA专题
人全基因组重测序和全外显子测序的比较
点击下方图片进入云平台资料汇总:

所见即所得,绘图高规格联川云平台,让科研更自由



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存